4 golden signals
Latency
Traffic
Errors
Saturation
USE method (machine の健全性)
Utilization (使用率)
決められた interval のなかで、resource が要求を處理するために busy 狀態だった時閒の割合。busy 狀態でも resource は新しい要求を處理できる場合があるが、新しい要求を處理できない度合ひは飽和度によって明らかにできる
Saturation (飽和度)
處理できない要求 (queue で待機してゐることが多い) を抱へてゐる度合ひ。pressure といふ用語でも同じことが表せる
Errors
error event の囘數
分野每
application
U 一定期閒中に要求を處理して busy 狀態になってゐる thread 數の平均の thread 總數に對する割合。たとへば、50% なら、平均して半分の thread が要求處理のために busy 狀態になってゐる
S 期閒中における要求 queue の長さの平均。worker thread 待ちで待機してゐた thread がいくつかあるかがわかる
E 何らかの理由で拒否された要求と失敗した要求の數
CPU
U CPU が busy だった時閒 (idle thread 以外を實行してゐた時閒) の割合
S on-CPU 待ちで queuing されてゐる實行可能 thread の割合
E 修正可能なものも含む CPU error
memory
U 物理 memory と假想 memory の兩方で、どの程度の memory が使はれてをり、どの程度の memory が free 狀態になってゐるかを check する
S page scan、paging、swaping、OOM killer による強制終了の度合ひは、memory pressure を緩和するための尺度となる
E software、hardware の error
disk
U device が busy 狀態だった時閒
S I/Oが queue で待機している度合ひ
E device error
network
U interface が frame の送受信で busy だった時閒
S interface の使用率が 100% になったために發生した queuing、buffering、blocking の度合ひ
E 受信側では、checksum 誤り、短か過ぎる frame (datalink header 未滿) や長過ぎる frame、collision (switch を使った network ではあまり起きない)、送信側では、late collision (配線の不良)
RED method (user から見た健全性)
Rate (要求率)
req/sec
1 秒あたりの service 要求の數
Errors
失敗した要求の數
Duration (處理時閒)
要求の處理が終はるまでの時閒
平均のほか、percentile などの分布の統計量も考慮する